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Optimierte Proteinsynthese 



Beschrefbung 

Die Erfindung betrlfft ein Verfahren zur optimierten Herstellung von 
Protemen In einem in vitro oder in vivo Expressionssystem sowie dafiir 
geeignete Reagenzien. 

Hannig, G. & Makrides, S.C. (1998) Tibtech Vol 16, pp 54-60, haben 
Strategien zur Optimierung der heterologen Proteinexpression in E. coli 
beschrieben. Ein entscheidender Faktor ist hierbei die Eff izienz der Initiation 
der Translation. Die Verwendung bestimnnter Codons spielt hierbei eine 
gewisse Rolle. So konnten George et al. (1985) DNA Vol 4, pp 273-281, 
zeigen, dass die Expression eines heterologen Genes gesteigert werden 
kann, wenn man in dem Bereich nach dem Startcodon solche Codons 
verwendet, die In E. coli Genen haufig benutzt werden. Besonders wichtig 
fur die Translations-Initiation sind hauptsachlich strukturelle Elemente am 
5'-Ende der mRNA. Von Makrides (1996) Microbiol. Rev. Vol 60, pp 512- 
538, wurden verschiedene Transiations-Verstarker-Sequenzen, wis 
beispielsweise eine Sequenz aus dem T7-Phagen Gen 10 Leader und eine 
U-reiche Sequenz aus der 5 '-untranslatierten Region einiger mRNA 's, wie 
beispielsweise des E. coli atpE Gens, beschrieben. 

Bislang wurden keine universell einsetzbaren Translations- 
Initiationssequenzen beschrieben. Es wurden jedoch Strategien 
beschrieben, die das Potential der Sekundarstruktur-Bildung am 5 '-Ende 
der mRNA reduzieren. Insbesondere wurde die Ribosomen-Bindungsstelle 
mit Adenin und Thymin Bausteinen angereichert. Stenstom et al. (2001) 
Gene Vol 263, pp 273-284, zeigten, dass stark exprimierte E. coli Gene 
insbesondere bei dem dem Startcodon folgenden + 2 Codon einen hohen 



Gehait an Adeninen aufweisen. Alierdings gibt es auch fOr diese Regel viele 
positive und negative Ausnahmen. 

SchlielSIich zeigten Pederson-Lane et al. (1997) Protein Expr. Purif. Vol 10, 
pp 256-262, dass ein hoher GC-Gehalt unmittelbar nach dem Startcodon 
negativ fur die Expression ist und mit Konversion der Purin Basen des 3., 4. 
und 5. Codons gegen Tliymidin Basen die Expression der 
Thymidylatsyntliase auf 25 % des Gesamtproteins gesteigert werden 
konnte. 

Es wird angenommen, dass bei all diesen MaCnahmen die Zugangigkeit der 
30S Ribosomenuntereinheit zu der messenger RNA eine entscheidende 
Rolle spielt. Besonders wichtig ist hierbei der freie Kontakt an die nach 
Shine und Dalgarno benannte Sequenz unmittelbar vor dem Startcodon und 
der Kontakt zu dem Startcodon selbst. Sind hingegen diese 
Sequenzelemente in stabilen RNA-Sekundarstrukturen gebunden, so lauft 
die Initiation der Translation sehr ineffizient. Tessier et al. (1 984) Nucl. Ac. 
Res. Vol 12, pp 7663-7675, zeigten in einer systematischen 
Untersuchung, dass durch eine gezielte Mutation diese Form von 
Stammchen und Schleifen (sogenannten Stem-Loops oder Hairpin-Loops) 
ahnelnden Sekundarstrukturen aufgeldst und damit die Effizienz der 
Translation erheblich gesteigert werden kann. Der Effekt dieser 
Sekundarstrukturen auf die Translation kann nach deren 
thermodynamischen Parametern berechnet werden. So bewirkt eine 
Stabillsierung um 1,4 kcal/mol eine lOfache Reduzierung der Expression 
(Gold (1988) Ann. Rev. Biochem, Vol 57, pp 199-233) und eine 
Stabillsierung um 2,3 kcal/mol reduziert die Bindung des Ribosoms um eine 
GroBenordnung (de Smit & van Duin (1994) J. Mol. Biol. Vol 244, pp 144- 
150). 

Von Sprengart et al. (1 996) EMBO Vol 1 5, pp 665-674, wurde als weiterer 
Translations-Verstarker die sogenannte .Downstream Box", ein 
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Sequenzelement direkt nach dem Startcodon der T7-Gene mit Homologie 
zur ribosomalen 16S RNA beschrieben. Es wird angenommen, dass dieses 
Element durch eine Wechsewirkung der beiden homologen Basenpaare die 
Bindung der 30S Ribosomenuntereinlieit verstarlct. Allerdings eignet sich 
auch dieses Element nicht als universeller Translations-Verstarker. 

Die Nachteile bekannter Verfahren liegen darin, dass fur jedes neue Gen 
eine Optimierung der 5 '-Region der mRNA entweder in der 5'- 
untranslatierten Region oder in der translatierten Region durchgefQhrt 
werden muss, um die Codon-Verwendung zu optimieren, oder 
unerwQnschte Sekundarstrukturen der mRNA mit Auswirkung auf die 
Shine-Dalgarno Sequenz oder das Startcodon zu vermeiden. Dies bedarf im 
Regelfall einer aufwandlgen Analyse der RNA-Struktur mit entsprechenden 
Programmen (z.B. Mukund et al. (1999) Curr. Science Vol 76, pp 1486- 
1490, Oder Jaeger et al. (1990) IVIeth. Enzymol. Vol 183, pp 281-306), 
sowie mehrerer PCR-Amplifikationen und Klonierungssclnritte. Will man auf 
diese Weise eine grolSe Anzahl von Genen, beispieiweise aus einer 
Genbank exprimieren, so ist dazu in jedem Falle eine genaue Kenntnis der 
Sequenz erforderlich, weshalb diese Methoden nicht auf unbekannte Gene 
angewendet werden konnen. Seibst bei Kenntnis der Sequenzen ware 
dieses Verfahren wesentlich aufwgndiger als eine universeli anwendbare 
Methode. 



Ein weiterer Ansatz zur Verstarkung der Translation besteht darin, als 
universellen Translations-Enhancer ein Fusionsprotein mit einem stark 
exprimlerten Gen zu bilden, an dessen C-terminales Ende das gewunschte 
Gen gesetzt wird. Als Beispiel fiir den Erfolg dieser Strategic ist die Fusion 
mit dem Ubiquitin Gen zu nennen, wie sie von Butt et al. (1989) PNAS Vol 
86, pp 2540-2544, durchgefQhrt wurde. 

Auch dieser Ansatz kann jedoch nicht ohne Weiteres auf die Expression 
beliebiger Gene Qbertragen werden. Werden namlich Fusionsproteine 
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verwendet, so wird am N-Terminus des Proteins eine mehr oder weniger 
grol^e Fusion angefOgt, die aufgrund der GroUe und Eigenschaften des 
Fusionspartners mit der Funktion des gewunschten Proteins interferieren 
konnen. Je kleiner die Fusionsproteine oder Teile von diesen gewahit 
warden, desto geringer ist in vielen Fallen auch deren 
translationssteigernde Wirkung. Bei groSen Fusionsproteinen zeigt sich ein 
weiterer Nachteil prokaryontischer Expressionssysteme: Es steigt 
gieichzeitig die Wahrscheinlichkeit fiir unvollstandige Transkription oder 
Translation durch vorzeitige Termination oder interne Initialisierung. Auch 
die Wahrscheinlichkeit fiir proteolytischen Abbau ist erhoht. 

Es besteht somit ein Bedurfnis, ein Verfahren zur optimierten Hersteilung 
von Proteinen bereitzustellen, bei dem die Nachteile des Standee der 
Technik zumindest teilweise beseitigt sind. 

Ein Gegenstand der Erfindung ist ein Verfahren zur Hersteilung eines 
Proteins, umfassend die Schritte: 

(a) Bereitstellen einer fur das Protein kodierenden Nukleinsauresequenz, 
wobei 3'-seitig des Translations-Startcodons eine heterologe 
Nukleinsauresequenz im korrekten Leseraster eingefugt wird, die so 
gewahit wird, dass in einem Abstand von 6-30 Nukleotiden 3'-seitig 
des Translations-Startcodons eine Stem-Loop-Struktur ausgebildet 
wird, 

(b) . Bereitstellen eines zur Expression des Proteins geeigneten 

Expressionssysteme und 

(c) Einbringen der Nukleinsauresequenz gemal^ (a) in das 
Expressionssystem gema& (b) unter Bedingungen, dass das Protein 
synthetisiert wird. 

Die erfindungsgemaBe Losung fur ein universell optimiertes 
Expressionskonstrukt besteht darin, dass ein kleines heterologes 
DNA-Sequenzelement mit vorzugsweise maximal 201 Basenpaaren, 
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besonders bevorzugt maximal 45 Basenpaaren, unmittelbar nach dem 
Startcodon des zu exprimierenden Gens eingefOgt wird, welches die 
Ausblldung stabiler Stem-Loop-Strukturen Im Bereich der Shlne-Dalgarno- 
Sequenz und des Startcodons weitgehend verhindert und dadurch zur 
optimierten Translations-initiation und optimierter Proteinsynthese fCihrt. Es 
wird somit ein Fusionsprotein gebildet, wobei vorzugsweise nur ein Icleines 
Peptid mit maximal 67 Aminosauren und besonders bevorzugt maximal 1 5 
Aminosauren an das gewunschte Protein angefugt wird. 

Eine wichtige Vorraussetzung fQr das heterologe DNA-Sequenzelement ist, 
dass es im korrekten Leseraster eingefCigt wird, d.h. dass keine 
Rasterverschiebung Im zu exprimierenden Gen stattfindet. Eine weitere 
wichtige Eigenschaft des heterologen DNA-Sequenzelements ist, dass sich 
in der transkribierten RNA in einem Abstand von 6-30 Basen, vorzugsweise 
12-21 Basen, hinter dem Startcodon eine stabile Stem-Loop-Struktur 
ausbilden kann, wobei die Basenpaarung in der Stem-Loop-Struktur 
zumindest teilweise durch die eingefugte Sequenz bewirkt wird. Diese 
Stem-Loop-Struktur soil so beschaffen sein, dass sie nach der erfolgten 
initiation der Translation durch das Ribosom wieder aufgelost werden kann 
und somit nicht zu einem Abbruch der Translation fiihrt. Diese durch 
Einfuhrung der heterologen NukleinsSuresequenz in das 
Expressionskonstrukt entstandete Stem-Loop-Struktur kann sich be! nahezu 
jedem Gen in der gleichen Weise ausbilden und dadurch verhindern, dass 
die fQr die Translations-initiation wichtigen Sequenzen vor dem Loop 
groBere Sekundarstrukturen mit der kodierenden Sequenz des Gens 
eingehen konnen. Der Bereich unmittelbar vor dieser Stem-Loop-Struktur 
und nach dem Startcodon ist vorzugsweise eine Sequenz ohne 
Sekundarstruktur und kann auch keine Sekundarstruktur mit der 
5 '-untranslatierten Region ausbilden. Besonders bevorzugt Ist in dieser 
Region eine GC-arme Sequenz, da bei einer derartigen Sequenz die 
Ausbildung stabiler Sekundarstrukturen mit Sequenzen innerhalb der 
translatierten Region minimiert wird. 




- 6 - 



Das heterologe Nukleinsaure-Sequenzelement kann in die Zielsequenz, z.B. 
in einen Plasmidvektor zur Expression von heterologen Genen mit 
bekannten Kionierungs- oder/und Amplifikationstechniken eingefugt 
werden. IVIdglich ist z.B. der Aufbau dieser Sequenz durch PCR-Primer zur 
Klonierung des gewunschten Gens oder durch Primer, mit denen DNA- 
Expressionskonstrukte f iir die in vitro Proteinexpression hergestellt werden. 

Das erfindungsgemaBe Verfaliren kann zur Herstellung und gegebenenfails 
Gewinnung von Proteinen In in vitro Expressionssystemen eingesetzt 
werden. Beisplele fur geeignete in vitro Expressionssysteme sind 
prokaryontische in vitro Expressionssysteme, wie etwa Lysate von gram- 
negativen Bakterlen, beispielsweise von Eschericlnia coli, oder gram- 
positiven Bakterien, wie beispielsweise Bacillus subtilis, oder 
eukaryontische in vitro Expressionssysteme, wie etwa Lysate von 
Saugerzellen, wie beispielsweise von Kaninchen, Reticulocyten, liumanen 
Tumorzelllinien, Hamsterzelllinien, oder anderen Wirbeltierzellen, wie 
beispielsweise Oozyten und Eiern von Fischen und Amphibien, sowie 
Insektenzelllinien, Hefezeilen, Algenzellen oder Extrakte aus 
Pf lanzen keimen . 

Alternativ kann die Herstellung des Proteins in einem in vivo 
Expressionssystem erfolgen, wobei eine prokaryontische Zelle, z.B. eine 
gram-negative prokaryontische Wirtszelle, insbesondere eine E. coli Zelle, 
Oder eine gram-positive prokaryontische Zelle, insbesondere eine Bacillus 
subtilis Zelle, eine eukaryontische Wirtszelle, z.B. eine Hefezelle, eine 
Insektenzelle oder eine Wirbeltierzelle, insbesondere eine Amphibien-, 
FIsch-, Vogel- oder Saugerzelle, oder ein nicht-humaner eukaryontischer 
Wirtsorganismus ais Expressionssystem verwendet werden kann. 

Die Einfuhrung der heterologen Nukleinsaure-Sequenz in die fiir das 
gewiinschte Protein kodierenden Nukleinsaure-Sequenz kann durch 
Standardmethoden der Molekularbiologie, z.B. durch Klonierung, wie etwa 



Restriktionsspaltung oder/und Ligation, durch Rekombinatlon oder/und 
durch Nukleinsaureamplifikation erfolgen. Die Nukleinsaure-Zielsequenz 
kann dabei auf einem geeigneten Vektor, z.B. einem Plasmidvektor zur 
Expression von heterologen Genen, oder auf einem Konstrukt fur eine in 
vitro Proteinexpression vorliegen. Besonders bevorzugt ist eine 
Nukleinsaureamplifikation in einem oder mehreren Schritten, wobei durch 
Auswahl geeigneter Primer die heterologe Nukleinsauresequenz und 
gegebenenfalls Expressionskontrollsequenzen, wie etwa Promoter, 
ribosomale Bindungensstellen und Terminatoren, an die fur das gewunschte 
Protein kodierende Nukleinsaure-Sequenz angefugt werden. Besonders 
bevorzugt ist eine Zweistufen-PCR, wobei in einer ersten Stufe zumindest 
ein Teil der heterologen Nukleinsaure-Sequenz an eine Nukleinsaure- 
Zielsequenz, die fur das gewOnschte Protein kodiert, und in einem zweiten 
Schritt Expressionskontrollsequenzen angefugt werden. Eine bevorzugte 
Ausfuhrungsform zur Durchfuhrung einer Zweischritt-PCR ist in den 
Beispielen exemplarisch dargestellt. 

Die heterologe Nukleinsaure-Sequenz, die In der Lage ist, eine Stem-Loop- 
Struktur 3'-seitig des Translations-Startcodons auszubilden, wird im 
korrekten Leseraster 3'-seitig des Translations-Startcodons, ubiicherweise 
des ersten ATG-Codons, in die fur das gewQnschte Protein kodierende 
Nukleinsaure-Sequenz eingefugt. Vorzugsweise erfolgt die Einfugung in 
einem Abstand bis zu 6 Nukleotiden, besonders bevorzugt unmittelbar nach 
dem Translations-Startcodon- Eine Einfugung im "korrekten Leseraster" 
bedeutet dabei, dass keine Verschiebung des Leserahmen in der Protein- 
kodierenden Nukleinsaure-Sequenz erfolgt. Dies bedeutet wiederum, dass 
die Lange der heterologen Nukleinsaure-Sequenz in Nukleotiden ein 
Vielfaches von 3 ist. Bevorzugt ist die Lange im Bereich von 6-201 
Nukleotiden, besonders bevorzugt im Bereich von 12-45 Nukleotiden. 

Die Einfugung der heterologen Nukleinsaure-Sequenz in die Protein- 
kodierende Nukleinsaure-Sequenz erfolgt derart, dass eine Stem-Loop- 



Struktur in einem geeigneten Abstand 3'-seitig des Translations-Codons 
ausgebildet wird. Der Abstand (zwischen dem letzten Nukleotid des 
Translattonsstart-Codons und dem ersten Nukleotid des Stem) betragt 
gunstigerweise 6-30 Nukleotide, besonders bevorzugt 12-21 Nukleotide. 
5'-seltig derjenigen Sequenzen, die fur die Bildung der Stem-Loop-Struktur 
vorgesehen sind, enthalt die heterologe Nukleinsaure-Sequenz 
vorzugsweise einen AT-reichen Bereich, d.h. einen Bereich mit einem AT- 
Gehalt >50 %, insbesondere >60 %. 

Die Lange des Stems in der Stem-Loop-Struktur liegt vorzugsweise im 
Bereich von 4 bis 12 Nukleotiden, besonders bevorzugt von 5 bis 10 
Nukleotiden. Der Stem der Stem-Loop-Struktur enthalt vorzugsweise zwei 
vollstandig zueinander komplementare Abschnltte. Es konnen jedoch auch 
ein Oder mehrere Basenfehlpaarungen vorhanden sein, sofern dadurch die 
Stabilitat nicht zu stark verringert wird. Die Basenpaarungen im Stem 
konnen AT- und GC-Basenpaarungen und Kombinationen davon sein. Ein 
Anteil der GC-Basenpaarungen von >50 % ist bevorzugt. Die Lange des 
Loops betragt vorzugsweise 2 bis 8 Nukleotide, sie ist jedoch nicht 
sonderlich kritisch. Die thermodynamische Stabilitat der Stem-Loop- 
Struktur ist zweckma&igerweise hoch genug, dass die Ausbildung einer 
Sekundarstruktur im Bereich des ATG-Startcodons, der 15 5'-iiegenden 
Nukleotide, welchedieShine-Dalgarno-Sequenzbeinhalten, und mindestens 
der 5 3'-befindlichen Nukleotide verhindern. Andererseits sollte die 
thermodynamische Stabilitat der Stem-Loop-Struktur nicht so hoch sein, 
dass die Prozessierung des Ribosoms auf der mRNA behindert wird. 
Vorzugsweise liegt die thermodynamische Stabilitat der Stem-Loop-Struktur 
im Bereich von -4 bis -15 kcal/mol. 

Die zur Expression des gewunschten Proteins verwendeten 
Expressionskontrollsequenzen umfassen Promotoren, ribosomale 
Bindungssteilen, d.h. Shine-Dalgarno-Sequenzen fur prokaryontische 
Expressionssysteme bzw. Kozak-Sequenzen fur eukaryontische 



Expressionssysteme, Enhancer, Terminatoren, Polyadenylierungs- 
Sequenzen etc. Dem Fachmann sind entsprechende 
Expressionskontrollsequenzen aus Stand ardlehrbuchern der 
Molekularbiologie, z.B. Sambrook et al. (1989) Molecular Cloning, A 
Laboratory Manual, Cold Spring Harbor oder Ausubel et al. (1 989) Current 
Protocols in Molecular Biology, John Wiley & Sons, New York, bekannt. 

Weiterhin kann die heterologe Nukleinsauresequenz auch Abschnitte 
enthalten, die fur eine Aufreinigungsdomane, z.B. eine Poiy-His-Domane, 
eine FLAG-Epitop-Domane etc., oder/und fur eine Proteinase- 
Erkennungsdomane, z.B. eine IgA-Protease- oder Faktor-X-Domane, 
kodieren. Durch die Aufreinigungsdomane kann die Gewinnung des 
gewunschten Proteins, z.B. aus einem in vitro Translationsansatz oder einer 
Wirtszelle bzw. dem zur Kuitivierung verwendeten Medium, vereinfacht 
werden. Durch Protease-Spaltung innerhalb der Protease- 
Erkennungsdomane kann die heterologe Peptidsequenz von dem 
gewunschten Protein abgespalten werden. 

Die heterologe Nukleinsauresequenz oder/und die fur das gewunschte 
Protein kodierende Nukleinsauresequenz werden - um eine weitere 
Verbesserung der Expressionshohe zu erreichen - gunstigerwelse so 
gewahit, dass sie zumindest teilweise eine an das jeweilige 
Expressionssystem angepasste Codon-Nutzung aufweisen. 

Ein weiterer Gegenstand der Erflndung 1st ein Reagenz zur Herstellung eines 
Proteins, umfassend 

(a) eine zu der fur das gewunschte Protein kodierenden 
Nukleinsauresequenz heterologe Nukleinsauresequenz, die im 
korrekten Leseraster in die Protein-kodierende Nukleinsauresequenz 
eingefugt werden kann, und die in einem Abstand von 6-30 
Nukleotiden 3'-seitig des Translations-Startcodons eine Stem-Loop- 
Struktur ausbilden kann, und 
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(b) ein zur Hersteilung des Proteins geeignetes Expressionssystem. 

Die heterologe Nukleinsauresequenz Icann in Form einer vollstandigen 
Sequenz oder in Form von melireren Teilsequenzen vorliegen. 

Das erfindungsgemalSe Verfahren und Reagenz sind insbesondere fur die 
Synthese von Proteinen schwer exprimierbarer Gene sowie der Synthese 
von Proteinen ausgehend von Genbanken anwendbar, da hierbei die 
Erfolgsrate gegenuber der bei der Verwendung ubiicher 
Expressionsvektoren gesteigert werden kann. 

Weiterhin soil die vorliegende Erfindung durch die nachfolgenden 
Abbildungen und Beispiele naher eriautert werden. 

Es zeigen: 

Figur 1 eine schematische Darstellung der zur Durchfuiirung einer 
Zweischritt~PCR notwendigen Nukleinsaure-Sequenzelemente; 

Figur 2 eine schematische Darstellung von unterschiedlich langen Stem- 
Loop-Strukturen in zur Einfugung in GFP Expressionkonstrukte 
verwendeten heterologen Nukleinsaure-Sequenzen; 

Figur 3 eine Auswertung der Ergebnisse bei der Expression von GFP unter 
Verwendung der Hairpin-Loop-GFP-Konstrukte gemaB Figur 3 in einem 
RTS-Expressionssystem. 1 /yl jedes Ansatzes (Doppelbestimmungen) wurde 
elektrophoretisch iiber SDS-PAGE auf getrennt und auf eine PVDF-Membran 
geblottet- Die Detektion erfolgte uber DCP-Star und Lumi-lmager; 

Figur 4 eine schematische Darstellung von unterschiedlichen positionierten 
Stem-Loop-Strukturen in zur EinfOgung von GFP-Expressionskonstrukte 
verwendeten heterologen Nukleinsauresequenzen; 
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Figur 5 die Expression von GFP unter Verwendung der in Figur 4 
dargestellten heterologen Nulcleinsaure-Sequenzen. Die DurchfQhrung und 
Auswertung der Ansatze erfolgte wie in der Legende zur Figur 3 
beschrieben; 

Figur 6 eine Auswertung der Ergebnisse bei der Expression des CIITA Gens 
(Wildtyp: Spur 1; Mutanten Spuren 2-10) unter Verwendung 
untersciiiedlicher heterologer Nukieinsauresequenzen mit Stem-Loop- 
Strulcturen; 

Figur 7 eine Auswertung der Ergebnisse bei der Expression des CIViV 
Capsid (1049) Gens (Wildtyp: Spur 1; Mutanten Spuren 2-10) unter 
Verwendung unterschiedlicher ineterologer Nulcleinsauresequenzen mit 
Stem-Loop-Strukturen; 

Figur 8 eine Auswertung der Ergebnisse bei der Expression des Survivin 
Gens (Wildtyp: Spur 10; Mutanten Spuren 1-9) unter Verwendung 
unterschiedlicher heterologer Nukieinsauresequenzen mit Stem-Loop- 
Strukturen; 

Figur 9 eine Auswertung der Ergebnisse bei der Expression des GFP Gens 
(Wildtyp: Spur 10; Mutanten Spuren 1-9) ' unter Verwendung 
unterschiedlicher heterologer Nukieinsauresequenzen mit Stem-Loop- 
Strukturen; 

Figur 10 eine Auswertung der Ergebnisse bei der Expression des GFP und 
des 1049 Gens unter Verwendung unterschiedlicher heterologer 
Nukieinsauresequenzen mit und ohne Stem-Loop-Strukturen; 

Figur 1 1 eine Auswertung der Ergebnisse bei der Expression des CIITA und 
des Survivin Gens unter Verwendung unterschiedlicher heterologer 
Nukieinsauresequenzen mit und ohne Stem-Loop-Strukturen; 




- 12- 



Figur 12 eine schematische Darsteilung von zwei unterschiedlichen Stem- 
Loop-Strukturen in den erfindungsgemal^n heterologen Sequenzen; 

Figur 13 eIne Auswertung der Ergebnisse mlt den in Figur 12 gezeigten 
5 Stem-Loop-Strukturen. 

Beispiele 

Beispiel 1: Zweischritt-PCR 

10 

Mit Hilfe einer Zwelschritt-PCR konnen zu exprimierende Gene amplifiziert 
und mlt den entsprechenden Kontrollregionen, wie T7-Promotor, T7 
Geni 0-Leader (g1 0), Ribosomaler Bindungsstelle (RBS) und T7-Terminator, 
versehen werden. Im ersten Schritt wird mittels eines Paares von Primern 

15 (A, B), die jeweils auf 15 Basen Lange mit dem entsprechenden Gen 
komplementar sind und 1 5 weitere Basen enthalten, die komplementar zu 
einem zweiten Primerpaar (C, D) sind, das Gen amplifiziert. Das zweite 
Primerpaar entlialt alle wictitigen regulatorischen Elemente, die somit bei 
einer zweiten PCR-Amplifikation an das Gen angehangt werden (siehe Figur 

20 1). 

Ober den A-Primer konnen bei dieser Metliode Veranderungen im 
5 '-Bereich des Gens eingefuhrt werden. Bei den Hairpin-Loop- Konstrukten 
wurden uber diesen A-Primer Hairpin-Loops mit unterschiedlicher Lange des 
25 Hairpin-Loop- Stamms und in unterschiedlicher Position hinter dem 
Start-Codon in die Gen-Sequenz inseriert. 

Primer C (SEQ ID NO. 1) 

T7-Promotor 

30 5 ^-GAAA TTAATACGACTCACTATA GGGAGACCACAAnGnTTTnnnTf^T 



QlO 



RBS 
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AGAAATAATTTTG TTTAACTTTA AG AAGGAGAT ATACC-3 ' 



Komplementar zu A 



5 



Primer D (SEQ ID NO. 2) 

T7-Terminator 

10 5^- CAAAAAACCCCTCAAGACCCGTTTAGAGGCCCCAAGGGG GGCCGC 

CAGTGTGCTGAATTCGCCTTTTATTA-3 ' 

Komplementar zu B 

15 Reakttonsbedinqunqen 

Die PCR-Reaktionen wurden iiblicherweise nach folgendem Schema mit 
dem Expand High Fidelity Kit (Roche Applied Science) im 50 jj\ MaBstab 
durchgefiihrt: 

20 PGR 1: Template 10ng/Ansatz; Primer A 20 pmol/Ansatz; Primer B 



25 



PGR 2: 



20 pmol/Ansatz 

95 "G 5 min + 20 mal (95 ^G 1 min + 55 1 min + 72 "G 

1 min) + 4 'G 

2 jjl PGR 1 ; Primer G 20 pmol/Ansatz; Primer D 20 
pmol/Ansatz 

95 'G 5 min + 30 mal (95 '^G 1 min + 50 'G 1 min + 
72 "^G 1 min) + 72 10 min +4 'G 



30 



Beide PCR-Reaktionen wurden jeweils durch Agarose-Gel-Elektrophorese 
uberpruft und die PGR-Produkte der PGR 2 gleichzeitig mit Hilfe eines 
DNA-Langenstandards, welcher definlerte DNA-Mengen enthalt, im Lumi- 
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Imager-System quantiflziert. Die daraus erhaltenen PCR-Produkte wurden 
direkt ats Template in RTS-Expressions-Ansatzen eingesetzt. 

Belspiei 2: Expression mit dem RTS in vitro Expressionssystem 

Die Expressionen mit dem RTS 100 HY Kit (Firms Roclne Applied Science) 
wurden in Batcli-Ansatzen zu je 50 fj\ nacJi der dem Kit beiliegenden 
Anieitung durchgefiihrt. Dabei wurden DNA-IVIengen von 0,25-1 //g pro 
Reaktions-Ansatz eingesetzt. Um die Ergebnisse einer Versuchsreihe 
vergleichen zu konnen, wurden immer gleiche Mengen des jeweiligen 
Templates eingesetzt. Die Ansatze wurden bei 30 'C fOr 4 h inkubiert. 

Belspiei 3: Expression von Hairpin-Loop-GFP-Konstrukten 

Es wurde am Beispiel von GFP (GrOn-Fiuoreszenz-Protein) untersucht, 
welchen Einfluss Hairpin-Loops (Haarnadel-formige Schileifen) in der mRNA 
direkt nach dem Start-ATG ausuben. Dazu wurden RNA-Sequenzen 
ermittelt, die Hairpin-Loops (HL) mit untersciiied lichen Stammlangen 
ausbilden. Je langer der Stamm des Hairpin-Loops ist, um so energetisch 
stabiier ist diese Struktur. Bei der Erstellung der Hairpin-Loops wurde 
darauf geachtet, dass nur in £. coli Genen hSufig zu findende Codons 
verwendet wurden. Die ermittelten Sequenzen fQr die verschiedenen 
Hairpin-Loops wurden mittels mRNA-Sekundarstrukturanalyse auf ihre 
Stabilitat im gesamten Konstrukt hin iiberpruft. Fur Sequenzen, die 
genugend Stabilitat aufwiesen, wurden Primer erstellt, die in der 
beschriebenen Zweischritt-PCR gemSK Beispiel 1 eingesetzt wurden. 

Primer A: 

oline Hairpin-Loop (SEQ ID NO. 3) 

Komplementar zu C GFP 
5 -AGGAGATATACCATGACTAGCAAAGGAGAA-3 ' 
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Stammlange 4 bp (SEQ ID N0.4) 

Komplementar zu C HL 4 bp GFP 
5 '-AGGAGATATACCATGACTAATTTTAGTACTAGCAAAGGAGAA-3 ' 

Stammlange 5 bp (SEQ ID NO. 5) 

KomplementSr zu C HL 5 bp GFP 

5 '-AGGAGATATACCATGACTGTTTATACAGTAACTAGCAAAGGAGAA-3 ' 

Stammlange 6 bp (SEQ ID NO. 6) 

KompiementSr zu C HL 6 bp GFP 

5 ' -AGGAGATATACCATG ACTGGTC AATTACCAGTA ACTAGC AAAGG AG 
AA-3 ' 

Stammlange 7 bp (SEQ ID NO. 7) 

Komplementar zu C HL 7 bp GFP 

5 ' -AGGAGATATACCATGACTGCTTTACATC AAGCAQTAACTAGCAAAG 
GAGAA-3 ' 

Stammlange 8 bp (SEQ ID NO. 8) 

Komplementar zu C HL 8 bp GFP 

5 ' -AGGAGATATACCATGACTGCACGTGATCGTGCAGTAACTAGCAAAG 
GAGAA-3 ' 

Primer B (SEQ ID NO. 9) 

Komplementar zu D GFP 
5 '-ATTCGCCTTTTATTAATGATGATGATGATG-3 ' 

Eine schematische Darstellung der mRNA-Sekundarstrukturen der Hairpin- 
Loop-GFP-Konstrukte ist In Figur 2 gezeigt. 



RTS Expression 
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Nach Expression Im RTS gemaiS Beispiel 2 wurde zur Verifjzierung die 
gebildete GFP-Menge Im Fluorlmeter gemessen und der Western-Blot 
mittels CDP-Star-Detelctlon und Auswertung Im Lumi-lmager quantitativ 
analysiert. Die Ergebnisse sind In Figur 3 gezeigt. 

Es ist eindeutig erkennbar, dass die Expressionsrate mit der Stammlange 
des Hairpin-Loops variiert. Bis zu einer Stammlange von 5 bp ist die 
Expressionsrate relativ konstant, um dann anschlieSend abzufallen. Bel 
einer Stammlange von 8 bp ist nahezu keine Expression mehr nachwelsbar. 
DIese Untersuchungen bestatlgen die oben erhaltenen Ergebnisse. Man 
kann also sagen, dass ein Hairpin-Loop mit einer Stammlange ab 6 bp oder 
besser mit einer Freien Energie von -7,8 kcal/moi eine Struktur darstellt, 
die einen erheblichen Einfluss auf die Expression ausubt. Zu erklaren ist 
dies damit, dass diese Struktur bel den Expressionsbedingungen stabll ist 
und somit das vorgelagerte Start-ATG nicht frel zugangllch ist. 

Beispiel 4: Ermittlung des minimalen Abstandes zum Start-ATG 

Um nun zu bestimmen, bis zu welchem Abstand ein solcher Hairpin-Loop 
eInen Einfluss auf die Expression ausubt, wurde der Halrpln-Loop mit der 
Stammlange 8 bp (Energie -1 1,8 kcal/mol) In Schrltten zu je 3 Basen vom 
Start-ATG weg in die GFP-Sequenz verschoben. Die Sequenzen der auf 
diese Weise erhaltenen A-Prlmer war wie folgt: 

Stammlange 8 bp, 6 Basen in die GFP-Sequenz hineinverschoben (SEQ ID 
NO. 10): 

HL 8 bp GFP 
5 '-AGG...ATGACTAGCACT...GTAAAAGGAGAAGAACTT-3 ' 



Stammlange 8 bp, 9 Basen In die GFP-Sequenz hineinverschoben (SEQ ID 
NO. 11.): 

HL Sbp GFP 
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5 '-AGG...ATGACTAGCAAAACT...GTAGGAGAAGAACTTTTC-3 ' 



Stammlange 8 bp, 1 2 Basen in die GFP-Sequenz hineinverschoben (SEQ ID 
N0.12): 

HL 8 bp GFP 
5 '-AGG...ATGACTAGCAAAGGAACT...GTAGAAGAACTTTTCACT-3 ' 



Stamml§nge 8 bp, 1 5 Basen In die GFP-Sequenz hineinverschoben (SEQ ID 
NO. 13): 

HL 8 bp GFP 
5 '-AGG...ATGACTAGCAAAGGAGAAACT...GTAGAACTTTTCACTGGA-3 ' 

Stammlange 8 bp, 18 Basen in die GFP-Sequenz hineinverschoben (SEQ ID 
NO. 14): 

HL 8 bp GFP 
5 ' - AGG . . . ATG ACTAG C A AAGG AG AAG A A ACT. . . GTACTTTTC ACTG GAG 
TT-3' 

Stammlange 8 bp, 21 Basen in die GFP-Sequenz hineinverschoben (SEQ ID 
NO. 15): 

HL 8bp GFP 

5 ' - AGG . . . ATG ACTAGC A AAGG AG A AG A ACTTACT. . . GTATTC ACTG GAG 
TTGTC-3 ' 

Diese DNA-Konstrukte mit den in Figur 4 gezeigten Sekundarstrukturen 
wurden ebenfalls uber Zweischritt-PCR mit den zuvor beschriebenen 
Primern B, C und D synthetisiert und direkt aus der PCR-Reaktion in 
Expressionsansatzen als Template eingesetzt. Dabei wurde durch 
Quantifizierung uber ein Agarose-Gel mit DNA-Marker VII und Auswertung 




- 18 - 



dieses Gels im Lumi-Imager sichergestellt, dass gleiche Mengen an 
Template eingesetzt wurden. Die Expresslonsansatze wurden uber einen 
Western-Blot ausgewertet. Die Ergebnisse sind in Figur 5 gezeigt. 

5 Die Expressionen lassen erkennen, dass ab einem Abstand von 9 Basen 
zum Start-ATG die Translation der mRNA moglich ist. Es besteht aber noch 
ein hemmender Einfluss des Hairpin-Loops. Erst ab einem Abstand von 12 
Basen verlauft die Translation wieder nahezu ungehemmt. Man kann also 
aus diesen Ergebnissen schliel^en, dass das Ribosom einen Platzbedarf von 

10 9-11 Basen nach dem Start-ATG besitzt. Des Weiteren lasst sich aus 
diesen Ergebnissen folgern, dass ein Hairpin-Loop, der 1 2 oder mehr Basen 
nach dem Start-ATG entfernt ist, zwar einen Einfluss auf die mRNA- 
Sekundarstruktur aber keinen auf die Initiation der Expression hat. 

15 Beispiel 5: Einfuhrung von Stem-Loop-Strukturen zur Auflosung 

ungunstiger Sekundarstrukturen 

Bei fruheren Expressionsansatzen mit dem Rapid Translation System 
(Roche Applied Science) wurde bei einigen Genen nur eine geringe oder gar 
20 keine Expression gefunden. Als Ursache hierfur wurde oft eine ungunstige 
RNA-Sekundarstruktur ermittelt, bei der entweder das Startcodon, oder die 
Shine-Dalgarno-Sequenz in einer Sekundarstruktur mit der Gensequenz 
involviert war, und damit In gebundener Form vorlag. 

25 Fur drei dteser Gene^ Survlvin, Cytomegalovirus Capsid Protein 1049 
(1049) und Class II Transactivator (CIITA) wurde eine heterologe 
Nukleinsauresequenz mit einem Hairpin-Loop und einer Stammlange von 7 
Basen in einem Abstand von 1 5 Basen nach dem Startcodon eingefCihrt. 
. Direkt anschlie&end an den Hairpin Loop wurde das Wildtyp-Gen (siehe 

30 unten *) ohne das Start ATG gesetzt. Vor den Hairpin- Loop wurden 
jeweils AT reiche Sequenzen gesetzt, welche weniger stabile 
Basenpaarungen als GC reiche Sequenzen ausbilden konnen. AuBerdem 
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wurde darauf geachtet keine fur E. coli seltenen Codons innerhalb der 
eingefuhrten Sequenzen zu verwenden. 

Dadurch, dass nun einerseits ein stabiler idealer Hairpin-Loop vorgegeben 
5 wird und andererseits direkt nach dem Startcodon eine Sequenz folgt, 
welche nicht zu Sekundarstrukturbildung neigt, sollte unabhangig vom 
nachfolgenden Gen eine freie Zugangigkeit fur den Initiationskomplex mit 
der kleinen ribosomaie Untereinheit an die Shine-Dalgarno-Sequenz und das 
Start- ATG ermoglicht werden. 

10 

Es wurden jeweils 9 verschiedene AT-reiche Sequenzen vor den 
Hairpin-Loops eingesetzt und mit den Wildtyp-Genen* verglichen. Als 
Kontrollgen wurde das GFP cycle 3 Protein mit den gleichen Hairpin-Loops 
und AT-reiclien Sequenzen uber die in Beispiel 1 erwahnte Zweischritt-PCR 

15 synthetisiert. Die Sequenzen der A und B Primer sind unten angegeben. In 
Primer 1 wurden jeweils die fiomologen Bereiche zu Primer C unterstrichen. 
Die AT-reiche Sequenz wurde in kursiv, der Hairpin-Loop in Fettdruck und 
die Wildtyp Gensequenz in fett und unterstrichen angegeben. In Primer B 
wurden die zu Primer D tiomologen Bereiche unterstrichen und die Bereiche 

20 mit Homologie zum Wildtyp Gen fett angegeben. Als Primer D wurde 
abweichend zu Beispiel 1 der folgende Primer benutzt: 

Primer D (SEQ ID NO 16): 

CAAAAAACCCCTCAAGACCCGTTTAGAGGCCCCAAGGGGTTGGGAGTA 
25 GAATGTT AAGGATTAGTTTATTA 

Die unterstrichene Region 1st homolog zu Primer C. 

Varianten Primer A: 
1049 - 1 (SEQ ID NO. 17): 
30 AGG AG ATATACCATG>4>1>4 TA TA CA TA rrcrCTGCACGTGATCGTGCAG 
GCTAACACCGCG 
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1049 - 2 fSEQ ID MQ: 181: 

AGGAGATATACCATGAAAACATATTATTCTCTGCACGTGATCGTGCAG 
GCTAACACCGCG 

1049 - 3 (SEQ IP MO. 19): 

AGGAGATATACCATGAAATATTCTTATACACTGCACGTGATCGTGCAG 
GCTAACACCGCG 



10 

1049 - 4 (SEQ ID NO. 20): 

AGGAGATATACCATGAAATATTATTCTACACTGCACGTGATCQTGCAG 
GCTAACACCGCG 

15 1049 - 5 (SEQ ID NO. 21): 

AGGAGATATACCATGAAATATACATATTCACTGCACGTGATCGTGCAG 
GCTAACACCGCG 

1049 - 6 (SEQ ID NO. 22): 
20 AGGAGATATACCATGAAAACATATTATTCACTGCACGTGATCGTGCAG 
GCTAACACCGCG 

1049 - 7 (SEQ ID NO. 23): 

AGGAGATATACCATGAAATATTCATATACACTGCACGTGATCGTGCAG 
25 GCTAACACCGCG 

1049 - 8 (SEQ ID NO. 24): 

AGGAGATATACCATGAAATATTATTCAACACTGCACGTGATCGTGCAG 
GCTAACACCGCG 

30 

1049 - 9 (SEQ ID NO. 25): 
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AGGAGATATACCATGCATCATCATCATCATCTGCACGTGATCGTGCAG 
GCTAACACCGCG 

1049 - 10 (WildtVD) fSEQ ID NO. 26): 
5 AGGAGATATACC ATGGCTAACACCGCG 

1049 - Primer B fSEQ ID NO. 27): 

AGGATTAGTTTATTAA TGATGATGATGATGATGGCGCCGGfiTGCGCGA 
Unterstrichenes ist homoloq zu Primer D 

10 

Varianten Primer A: 
Survivin - 1 fSEQ ID NO. 28): 

AGGAGATATACCATG>il>4>l TA TACA TA 7TC7CTGCACGTGATCGTGCAG 
IS GGTGCCCCGACG 

Survivin - 2 fSEQ ID NO. 29): 

AGGAGATATACCATGAAAACATATTATTCTCTGCACGTGATCGTGCAG 
GGTGCCCCGACG 

20 

Survivin - 3 (SEQ ID NO. 30): 

AGGAGATATACCATGAAATATTCTTATACACTGCACGTGATCGTGCAG 
GGTGCCCCGACG 

25 Survivin - 4 fSEQ ID NO. 31): 

AGGAGATATACCATGAAATATTATTCTACACTGCACGTGATCGTGCAG 
GGTGCCCCGACG 

Survivin - 5 fSEQ ID NO. 32): 
30 AG G AG ATATACC ATG AAATATACATATTC ACTGCACGTG ATCGTGCAG 
GGTGCCCCGACG 
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Survivin - 6 fSEQ ID WO. 33); 

AGGAGATATACCATGAAAACATATTATTCACTGCACGTGATCGTGCAG 
GGTGCCCCGACG 

5 Survivin - 7 (SEQ ID NO. 34); 

AGGAGATATACCATGAAATATTCATATACACTGCACGTGATCGTGCAG 
GGTGCCCCGACG 

Survivin - 8 fSEQ ID WO. 35); 
10 AGGAGATATACCATGAAATATTATTCAACACTGCACGTGATCGTGCAG 
GGTGCCCCGACG 

Survivin - 9 fSEQ ID WO. 36); 

AGGAGATATACCATGCATCATCATCATCATCTGCACGTGATCGTGCAG 
15 GGTGCCCCGACG 

Survivin - 10 fA Wildtvp) (SEQ ID NO. 37): 
AGGAGATATACCATGGGTGCCCCGACG 



20 Survivin - Primer B (SEQ ID WO. 38): 

AGGATTAGTTTATTAA TGATGATGATGATGATGATCCATGGCAGCCAGC 

CIITA - 1 (SEQ ID NO: 39); 

AGG AGATATACCATGA/M TA TACA TA 7TC7CTGCACGTGATCGTGCAG 
25 GAGTTGGGGCCC 

CIITA - 2 (SEQ ID WO. 40): 

AGGAGATATACCATGAAAACATATTATTCTCTGCACGTGATCGTGCAG 
GAGTTGGGGCCC 

30 

CIITA - 3 (SEQ ID NO. 41); 
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AGGAGATATACCATGAAATATTCTTATACACTGCACGTGATCGTGCAG 
GAGTTGGGGCCC 

CIITA - 4 (SEQ ID NO: 42: 

5 AGGAGATATACCATGAAATATTATTCTACACTGCACGTGATCGTGCAG 
GAGTTGGGGCCC 

CIITA - 5 (SEQ ID NO. 43): 

AGGAGATATACCATGAAATATACATATTCACTGCACGTGATCGTGCAG 
10 GAGTTGGGGCCC 



CIITA - 6 (SEQ ID NO. 44): 
1 5 AGG AG ATATACCATGAAAACATATTATTCACTGCACGTG ATCGTGCAG 
GAGTTGGGGCCC 

CIITA - 7 fSEQ ID NO. 45): 

AGGAGATATACCATGAAATATTCATATACACTGCACGTGATCGTGCAG 
20 GAGTTGGGGCCC 

CIITA - 8 (SEQ ID NO. 46): 

AGGAGATATACCATGAAATATTATTCAACACTGCACGTGATCGTGCAG 
GAGTTGGGGCCC 

25 

CIITA - 9 SEQ ID NO. 47): 

AGGAGATATACCATGCATCATCATCATCATCTGCACGTGATCGTGCAG 
GAGTTGGGGCCC 



30 



CIITA - 10 (A Wildtvp) (SEQ ID NO: 48): 
AGGAGATATACCA TGGAGTTGGGGCCC 
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CIITA Primer B fSEQ ID NO. 49): 

AGGATTAGTTTATTAT TAATGATGATGATGATGATGAGAACCCCC 

Im Folgenden sind die Sequenzen der uber PGR erzeugten 
Expressionskonstrukte fur die Mutante 1 und den Wlldtyp angegeben. Die 
Wildtyp-Gensequenz ist fett angegeben. Am Ende des Gens wurde mit dem 
B-Primer jeweils ein iiexa-Histidin-Tag zur Detelction mit einem spezifischen 
Antikdrper eingefuhrt (unterstrichen). 

1049 - 1 (431 bp) fSEQ ID NO. SO): 

GAAATTAATACGACTCACTATAGGGAGACCACAACGGTTTCCCTCTAG 

AAATAATTTTGTTTAACTTTAAGAAGGAGATATACCATGAAATATACAT 

ATTCTCTGCACGTGATCGTGCAGGCTAACACCGCGCCGGGACCCAGGG 

TGGCAAACAAGCGGGACGAAAAACACCGTCACGTCGTTAACGTCGTTT 

TCCAGCTGCCGACCGAGATATCAGAGGCCACCCACCCGGTGTTGGACA 

CCATGCTGAGCAAGTACACGCGCATGTCCAGCCTGTTTAATGACAAGT 

GCGCCTTTAAGCTGGACCTGTTGCGCATGGTAGCCGTGTCGCGCACCC 

GGCGC CATCATCATCATCATCATT AATAAACTAATCCTTAAnATTP.TAn 

TCCCAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTG 
1049 - 10 (WildTvp) (398 bp) fSEQ ID NO. 51): 

GAAATTAATACGACTCACTATAGGGAGACCACAACGGTTTCCCTCTAG 

AAATAATTTTGTTTAACTTTAAGAAGGAGATATACCATGGCTAACACCG 

CGCCGGGACCCACGGTGGCCAACAAGCGGGACGAAAAACACCGTCAC 

GTCGTTAACGTCGTTTTGGAGCTGCCGACCGAGATATCAGAGGCCACC 

CACCCGGTGTTGGCCACCATGCTGAGCAAGTACACGCGCATGTCCAGC 

CTGTTTAATGACAAGTGCGCCTTTAAGCTGGACCTGTTGCGCATGGTAG 

CCGTGTCGCGCACCCGGCG CCATCATCATCATCATCATT AATAAACTA 

ATCCTTAACATTCTACTCCCAACCCCTTGGGGCCTCTAAACGGGTCTTG 

AGGGGTTTTTTG 
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Survivih - 1 (632 bol (SEQ ID NO. 

GAAATTAATACGACTCACTATAGGGAGACCACAACGGTTTCCCTCTAG 
AAATAATTTTGTTTAACTTTAAGAAGGAGATATACCATGAAATATACAT 
ATTCTCTGCACGTGATCGTGCAGGGTGCCCCGACGTTGCCCCCTGCCTG 
5 GCAGCCCTTTCTCAAGGACCACCGCATCTCTACATTCAAGAACTGGCC 
CTTCTTGGAGGGCTGCGCCTGCACCCCGGAGCGGATGGCCGAGGCTGG 
CTTCATCCACTGCCCCACTGAGAACGAGCCAGACTTGGCCCAGTGTTT 
CTTCTGCTTCAAGGAGCTGGAAGGCTGGGAGCCAGATGACGACCCCAT 
AGAGGAACATAAAAAGCATTCGTCCGGTTGCGCTTTCCTTTCTGTCAAG 
1 0 AAGCAGTTTGAAGAATTAACCCTTGGTGAATTTTTGAAACTGGACAGA 
GAAAGAGCCAAGAACAAAATTGCAAAGGAAACCAACAATAAGAAGAA 
AGAATTTGAGGAAACTGCGAAGAAAGTGCGCCGTGCCATCGAGCAGCT 
GGCTGCCATGGA TCATCATCATCATCATCATT AATAAACTAATCCTTAA 

CATTCTACTCCCAACCCCTTGGGQCCTCTAAACGGGTCTTGAGGGGTTT 
15 TTTG 

Survivin - 10 {Wildtvp) (599 bp) (SEQ ID NO. 53): 

GAAATTAATACGACTCACTATAGGGAGACCACAACGGTTTCCCTCTAG 
AAATAATTTTGTTTAACTTTAAGAAGGAGATATACCATGGGTGCCCCGA 

20 CGTTGCCCCCTGCCTGGCAGCCCTTTCTCAAGGACCACCGCATCTCTAC 
ATTCAAGAACTGGCCCTTCTTGGAGGGCTGCGCCTGCACCCCGGAGCG 
GATGGCCGAGGCTGGCTTOATCCACTGCCCCACTGAGAACGAGCCAGA 
CTTGGCCCAGTGTTTCTTCTGCTTCAAGGAGCTGGAAGGCTGGGAGCC 
AGATGACGACCCCATAGAGGAACATAAAAAGCATTCGTCCGGTTGCGC 

25 TTTCCTTTCTGTCAAGAAGCAGTTTGAAGAATTAACCCTTGGTGAATTT 
TTGAAACTGGACAGAGAAAGAGCCAAGAACAAAATTGCAAAGGAAAC 
CAACAATAAGAAGAAAGAATTTGAGGAAACTGCGAAGAAAGTGCGCC 
GTGCCATCGAGCAGCTGGCTGCCATGGA TCATCATCATCATCATCATT A 
ATAAACTAATCCTTAACATTCTACTCCCAACCCCTTGGGGCCTCTAAAC 

30 GGGTCTTGAGGGGTTTTTTG 



CIITA - 1 (1400 bp) (SEQ ID NO. 54): 
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GAAATTAATACGACTCACTATAGGGAGACCACAACGGTTTCCCTCTAG 

AAATAATTTTGTTTAACTTTAAGAAGGAGATATACCATGAAATATACAT 

ATTCTCTGCACGTGATCGTGCAGGAGTTGGGGCCCCTAGAAGGTGGCT 

ACCTGGAGCTTCTTAACAGCGATGCTGACCCCCTGTGCCTCTACCACTT 

CTATGACCAGATGGACCTGGCTGGAGAAGAAGAGATTGAGCTCTACTC 

AGAACCCGACACAGACACCATCAACTGCGACCAGTTCAGCAGGCTGTT 

GTGTGACATGGAAGGTGATGAAGAGACCAGGGAGGCTTATGCCAATAT 

CGCGGAACTGGACCAGTATGTCTTCCAGGACTCCCAGCTGGAGGGCCT 

GAGCAAGGACATTTTCAAGCACATAGGACCAGATGAAGTGATCGGTGA 

GAGTATGGAGATGCCAGCAGAAGTTGGGCAGAAAAGTCAGAAAAGAC 

CCTTCCCAGAGGAGCTTCCGGCAGACCTGAAGCACTGGAAGCCAGCTG 

AGCCCCCCACTGTGGTGACTGGCAGTCTCCTAGTGGGACCAGTQAGCG 

ACTGCTCCACCCTGCCCTGCCTGCCACTGCCTGCGCTGTTCAACCAGG 

AGCCAGCCTCCGGCCAGATGCGCCTGGAGAAAACCGACCAGATTCCC 

ATGCGTTTCTCCAGTTCCTCGTTGAGCTGCCTGAATCTCCCTGAGGGAC 

CCATCCAGTTTGTCCCCACCATCTCCACTCTGCCCCATGGGCTCTGGCA 

AATCTCTGAGGCTGGAACAGGGGTCTCCAGTATATTCATCTACCATGGT 

GAGGTGCCCCAGGCCAGCCAAGTACCCCCTCCCAGTGGATTCACTGTC 

CACGGCCTCCCAACATCTCCAGACCGGCCAGGCTCCACCAGCCCCTTC 

GCTCCATCAGCCACTGACCTGCCCAGCATGCCTGAACCTGCCCTGACC 

TCCCGAGCAAACATGACAGAGCACAAGACGTCCCCCACCCAATGCCC 

GGCAGCTGGAGAGGTCTCCAACAAGCTTCCAAAATGGCCTGAGCCGGT 

GGAGCAGTTCTACCGCTCACTGCAGGACACGTATGGTGCCGAGCCCGC 

AGGCCCGGATGGCATCCTAGTGGAGGTGGATCTGGTGCAGGCCAGGCT 

GGAGAGGAGCAGCAGCAAGAGCCTGGAGCGGGAACTGGCCACCCCGG 

ACTGGGCAGAACGGCAGCTGGCCCAAGGAGGCCTGGCTGAGGTGCTG 

TTGGCTGCCAAGGAGCACCGGCGGCCGCGTCGACTCGAGCGAGCTCCC 

GGGGGGGGTTCTCATCATCATCATr.ATr ATTA at a at a a a^ta /^Tr^TT 

AACATTCTACTCCCAACCCCTTGGGGCCTCTAAACGGQTCTTGAGGGG 
TTTTTTG 



CIITA -10 WT 1367 bn fSEQ ID WQ. SRI- 
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GAAATTAATACGACTCACTATAGGGAGACCACAACGGTTTCCCTCTAG 
AAATAATTTTGTTTAACTTTAA GAAGGAGATATACCA TGGAGTTQQftQn 

CCCTAGAAGGTGGCTACCTGGAGCTTCTTAACAGCGATGCTGACCCCC 
TGTGCCTCTACCACTTCTATGACCAGATGGACCTGGCTGGAGAAGAAG 

6 AGATTGAGCTCTACTCAGAACCCGACACAGACACCATCAACTGCGACC 
AGTTCAGCAGGCTGTTGTGTGACATGGAAGGTGATGAAGAGACCAGGG 
AGGCTTATGCCAATATCGCGGAACTGGACCAGTATGTCTTCCAGGACT 
CCCAGCTGGAGGGCCTGAGCAAGGACATTTTCAAGCACATAGGACCAG 
ATGAAGTGATCGGTGAGAGTATGGAGATGCCAGCAGAAGTTGGGCAG 

1 0 AAAAGTCAG AAAAG ACCCTTCCCAG AGGAGCTTCCGGCAG ACCTGAA 
GCACTGGAAGCCAGCTGAGCCCCCCACTGTGGTGACTGGCAGTCTCCT 
AGTGGGACCAGTGAGCGACTGCTCCACCCTGCCCTGCCTGCCACTGCC 
TGCGCTGTTCAACCAGGAGCCAGCCTCCGGCCAGATGCGCCTGGAGAA 
AACCGACCAGATTCCCATGCCTTTCTCCAGTTCCTCGTTGAGCTGCCTG 

1 5 AATCTCCCTGAGGGACCCATCCAGTTTGTCCCCACCATCTCCACTCTGC 
CCCATGGGCTCTGGCAAATCTCTGAGGCTGGAACAGGGGTCTCCAGTA 
TATTCATCTACCATGGTGAGGTGCCCCAGGCCAGCCAAGTACCCCCTC 
CCAGTGGATTCACTGTCCACGGCCTCCCAACATCTCCAGACCGGCCAG 
GCTCCACCAGCCCCTTCGCTCCATCAGCCACTGACCTGCCCAGCATGC 

20 CTGAACCTGCCCTGACCTCCCGAGCAAACATGACAGAGCACAAGACGT 
CCCCCACCCAATGCCCGGCAGCTGGAGAGGTCTCCAACAAGCTTCCAA 
AATGGCCTGAGCCGGTGGAGCAGTTCTACCGCTCACTGCAGGACACGT 
ATGGTGCCGAGCCCGCAGGCCCGGATGGCATCCTAGTGGAGGTGGATC 
TGGTGCAGGCCAGGCTGGAGAGGAGCAGCAGCAAGAGCCTGGAGCGG 

25 GAACTGGCCACCCCGGACTGGGCAGAACGGCAGCTGGCCCAAGGAGG 
CCTGGCTGAGGTGCTGTTGGCTGCCAAGGAGCACCGGCGGCCGCGTCG 
ACTCGAGCGAGCTCCCGGGGGGGGTTC TCATCATCATCATCATCATT A 

ATAATAAACTAATCCTTAACATTCTACTCCCAACCCCTTGGGGCCTCTA 
AACGGGTCTTGAGGGGTTTTTTG 

30 

GFP CvC3 - 1 (938 ba) (SEQ ID NO. 
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GAAATTAATACGACTCACTATAGGGAQACCACAACGGTTTCCCTCTAG 

AAATAATTTTGTTTAACTTTAAGAAGGAGATATACCATGAAATATACAT 

ATTCTCTGCACGTGATCGTGCAGACTAGCAAAGGAGAAGAACTTTTCA 

CTGGAGTTGTCCCAATTCTTGTTGAATTAGATGGTGATGTTAATGGGCA 

CAAATTTTCTGTCAGTGGAGAGGGTGAAGGTGATGCTACATACGGAAA 

GCTTACCCTTAAATTTATTTGCACTACTGGAAAACTACCTGTTCCATGG 

CCAACACTTGTCACTACTTTCTCTTATGGTGTTCAATGCTTTTCCCGTTA 

TCCGGATCATATGAAACGGCATGACTTTTTCAAGAGTGCCATGCCCGA 

AGGTTATGTACAGGAACGCACTATATCTTTCAAAGATGACGGGAACTA 

CAAGACGCGTGCTGAAGTCAAGTTTGAAGGTGATACCCTTGTTAATCG 

TATCGAGTTAAAAGGTATTGATTTTAAAGAAGATGGAAACATTCTCGG 

ACACAAACTCGAGTACAACTATAACTCACACAATGTATACATCACGGC 

AGACAAACAAAAGAATGGAATCAAAGCTAACTTCAAAATTCGCCACA 

ACATTGAAGATGGATCCGTTCAACTAGCAGACCATTATCAACAAAATA 

CTCCAATTGGCGATGGCCCTGTCCTTTTACCAGACAACCATTACCTGTC 

GACACAATCTGCCCTTTCGAAAGATCCCAACGAAAAGAGAGACCACAT 

GGTCCTTCTTGAGTTTGTAACAGCTGCTGGGATTACACATGGCATGGAT 
GAACTATACAAACCCGGGGGGGGTTC TCATCATCATnATrATrAT TAA 

TAAACTAATCCTTAACATTCTACTCCCAACCCCTTGGGGCCTCTAAACG 
GGTCTTGAGGGGTTTTTTG 

pIVEX-GFP CvC3 - 10 905 bn fSgq ID MQ. 571; 

GAAATTAATACGACTCACTATAGGGAGACCACAACGGTTTCCCTCTAG 

AAATAATTTTGTTTAACTTTAAGAAGGAGATATACCATGACTAGCAAA 

GGAGAAGAACTTTTCACTGGAGTTGTCCCAATTCTTGTTGAATTAGATG 

GTGATGTTAATGGGCACAAATTTTCTGTCAGTGGAGAGGGTGAAGGTG 

ATGCTACATACGGAAAGCTTACCCTTAAATTTATTTGCACTACTGGAAA 

ACTACCTGTTCCATGGCCAACACTTGTCACTACTTTCTCTTATGGTGTTC 

AATGCTTTTCCCGTTATCCGGATCATATGAAACGGCATGACTTTTTCAA 

GAGTGCCATGCCCGAAGGTTATGTACAGGAACGCACTATATCTTTCAA 

AGATGACGGGAACTACAAGACGCGTGCTGAAGTCAAGTTTGAAGGTGA 

TACCCTTGTTAATCGTATCGAGTTAAAAGQTATTGATTTTAAAGAAGAT 
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GGAAACATTCTCGGACACAAACTCGAGTACAACTATAACTCACACAAT 
GTATACATCACGGCAGACAAACAAAAGAATGGAATCAAAGCTAACTTC 
AAAATTCGCCACAACATTGAAGATGGATCCGTTCAACTAGCAGACCAT 
TATCAACAAAATACTCCAATTGGCGATGGCCCTGTCCTTTTACCAGACA 
5 ACCATTACCTGTCGACACAATCTGCCCTTTCGAAAGATCCCAACGAAA 
AGAGAGACCACATGGTCCTTCTTGAGTTTGTAACAGCTGCTGGGATTAC 
ACATGGCATGGATGAACTATACAAACCCGGGGGGGGTTC TCATCATCA 
TCMSAICATTAATAAACTAATCCTTAACATTCTACTCCCAACCCCTTG 
GGGCCTCTAAACGGGTCTTGAGGGG I I I I I TG 

10 

Man kann an den in den Figuren 6 bis 9 gezeigten Expressionen ericennen, 
dass die mit den Stem-Loop-Strukturen syntiietisierten DNA Templates in 
alien Fallen zu einer Proteinsynthese fuhrten, wahrend beim Wildtypgen 
kelne Proteinsynthese stattfand. Die Mutante 9 mit der Hexa-Histidin 

1.6 Sequenz wird dabei etwas schlechter als die Qbrigen AT-reichen Sequenzen 
exprimiert, hat aber den Vorteil, dass man das entstehende Protein uber 
diese Markierung mit sechs Histldinresten an Ni-NTA-Chelat Saulen 
aufreinigen kann. Auch im Falle des GFP-Gens, einem ohnehin gut 
exprimierten Gen, fOhrten die Stem-Loop-Konstrukte zu einer 

20 Ausbeutesteigerung. 

Beispiel 6: Entfernen der Stem-Loop-Struktur zum Nachweis der Funktion 

Um die Wirkung der Stem-Loop-Struktur von der Wirkung der eingefOhrten 
25 AT-reichen Sequenz zu unterscheiden wurden von je zwei der Mutanten 
eine identische PGR jedoch ohne den Tell des Stem-Loops hergestellt und 
im direkten Vergleich mit den Stem-Loop-Mutanten exprimiert. 

An diesen Beispielen lasst sich deutiich der EInfluss der Stem-Loop-Struktur 
30 ersehen. Wahrend beim GFP die AT-reiche Sequenz allelne zu einer 
gesteigerten Expression fuhrt, bringt die Stem-Loop-Sequenz bei den 
schwer exprimierbaren Genen den entscheidenden Beitrag. 
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Beispiel 7: Modifikation der Stem-Loop-Struktur zur Ermittlung der fur die 
Funktion wichtigen Eigenschaften 

Um die Wirkung der GC-Basen innerhalb der Stem-Loop-Struktur zu 
ermlttein, wurde deren Sequenz durch eine AT-reiche Sequenz mit der 
gleichen freien Energie wie der des GC-reichen Stem-Loops ersetzt. 

Fur die Beispiele Survivin, CIITA und 1049 wurden dafur statt der 
ursprunglichen Stem-Loop-Sequenz CTG.CAC.GTG.ATC.GTG.CAG mit (G 
= -9,8 kcal/mol und einer Stammlange von 7 Basenpaaren ein neuer Stem- 
Loop (Loop') mit der Sequenz CAG.ACA.AAT.AGA.TAT.TTG.TCT.GTA mit 
(G = -9,8 kcal/mol und einer Stammlange von 9 Basenpaaren mit der AT- 
reichen Sequenz von Mutante 1 kombiniert. Die beiden Strukturen sind in 
Figur 1 2 gezeigt. 

Man kann erkennen, dass beide Stem-Loop-Varianten die Expression 
gegenuber den jeweiligen Wildtypgenen deutlich steigern oder erst 
ermoglichen. Die GC-reichen Stem-Loop-Varianten weisen dabei eine etwas 
deutlichere Expressionssteigerung auf. 
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AnsprQche 

Verfahren zur Herstellung eines Proteins, umfassend die Schritte: 

(a) Bereitstellen einer fur das Protein kodierenden 
Nukleinsauresequenz, wobei 3'-seitig des Translations- 
Startcodons eine heterologe Nukleinsauresequenz im 
korrekten Leseraster eingefiigt wird, die so gewahit wird, 
dass in einem Abstand von 6-30 Nukleotiden 3'-seitig des 
Translations-Startcodons eine Stem-Loop-Struktur ausgebildet 
wird, 

(b) Bereitstellen eines zur Expression des Proteins geelgneten 
Expressionssystems und 

(c) Einbringen der Nukleinsauresequenz gema& (a) in das 
Expressionssystem gemaB (b) unter Bedingungen, dass das 
Protein synthetisiert wird. 

Verfahren nach Anspruch 1 , weiterhin umfassend das Gewinnen des 
Proteins. 

Verfahren nach Anspruch 1 oder 2, 
dadurch gekennzeichnet, 

dass die eingefugte heterologe Nukleinsauresequenz eine Lange bis 
zu 201 Nukleotiden aufweist. 

Verfahren nach Anspruch 3, 
dadurch gekennzeichnet, 

dass die eingefugte heterologe Nukleinsauresequenz eine Lange bis 
zu 45 Nukleotiden aufweist. 
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Verfahren nach einem der AnsprQche 1 bis 4, 
dadurch gekennzeichnet, 

dass die Stem-Loop-Strulctur in einem Abstand von 12-21 
Nukleotiden 3'-seitig des Startcodons ausgebildet wird. 

Verfahren nacli einem der Anspruche 1 bis 5, 
dadurch gekennzeichnet, 

dass die Lange des Stem in der Stem-Loop-Struktur im Bereich von 
4-12 Nukleotiden ist. 

Verfahren nach einem der Anspruche 1 bis 6, 
dadurch gekennzeichnet, 

dass der Bereich der heterologen Nukleinsauresequenz, der 5'-seitig 
der Stem-Loop-Struktur liegt, setbst keine Sekundarstruktur ausbildet 
und keine Sekundarstruktur mit der 5'-untranslatierten Region der fur 
das herzustellende Protein kodierenden Nukleinsauresequenz 
eingehen kann. 

Verfahren nach einem der Anspruche 1 bis 7, 
dadurch gekennzeichnet, 

dass der Bereich der heterologen Nukleinsauresequenz, der 5'-seitig 
der Stem-Loop-Struktur und 3'-seitig des ATG-Startcodons liegt, 
einen GC-Gehalt von < 50 % auf weist. 

Verfahren nach einem der Anspruche 1 bis 8, 
dadurch gekennzeichnet, 

dass man ein in vitro Expressionssystem verwendet. 

Verfahren nach Anspruch 9, 
dadurch gekennzeichnet, 

dass man ein prokaryontisches in vitro Expressionssystem 
verwendet. 
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1 1 . Verf ahren nach Anspruch 1 0, 
dadurch gekennzeichnet, 

dass das prokaryontische in vitro Expressionssystem Lysate von 
gram-negativen Bakterien, insbesondere von Esctiericiiia coli, oder 
5 gram-positiven Bakterien, insbesondere Bacillus subtilis, enthalten. 

12. Verfahren nach Anspruch 9, 
dadurch gekennzeichnet, 

dass man ein eukaryontisches in vitro Expressionssystem 
10 verwendet. 

1 3- Verfahren nach Anspruch 1 2, 
dadurch gekennzeichnet, 

dass das eukaryontische In vitro Expressionssystem Lysate von 
15 Saugerzellen, insbesondere von Kaninchen, Reticulocyten, humanen 

Tumorzelllinien, Hamsterzelllinien, oder anderen Wirbeltierzellen, 
insbesondere Oozyten und Eiern von Fischen und Amphibian, sowie 
Insektenzelllinien, Hefezellen, Algenzellen oder Extrakte aus 
Pflanzenkeimen enthalt. 

20 

1 4. Verfahren nach einem der Anspruche 1 bis 8, 
dadurch gekennzeichnet, 

dass man ein prokaryontisches in vivo Expressionssystem 
verwendet. 

25 

15. Verfahren nach Anspruch 14, 
dadurch gekennzeichnet, 

dass man eine prokaryontische Wirtszeile als Expressionssystem 
verwendet. 



30 
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1 6. Verfahren nach Anspruch 1 5, 
dadurch gekennzeichnet, 

dass man eine gram-negative prokaryontische Wirtszelle, 
insbesondere eine E.coli Zelle, oder eine gram-positive 
5 prokaryontische Wirtszelle, insbesondere eine Bacillus subtills Zelle, 

verwendet. 



17- Verfahren nach Anspruch 14, 
dadurch gekennzeichnet, 
10 dass man eine eukaryontische Wirtszelle als Expressionssystem 

verwendet. 



1 8. Verfahren nach Anspruch 1 7, 
dadurch gekennzeichnet, 
15 dass man eine Hefezelle, eine Insektenzeile oder eine Wirbeltierzelle, 

insbesondere eine Amphibien-, Fische-, Vogel- oder Saugerzelie, 
verwendet. 



19. Verfahren nach Anspruch 14, 
20 dadurch gekennzeichnet, 

dass man einen nicht-humanen eukaryontischen Wirtsorganismus als 
Expressionssystem verwendet. 

20. Verfahren nach einem der Anspruche 1 bis 1 9, 
25 dadurch gekennzeichnet, 

dass das Bereitstellen der fur das Protein kodierenden 
Nukleinsauresequenz durch Klonierung, Rekombination oder/und 
Amplifikation erfolgt. 



30 21. 



Verfahren nach Anspruch 20, 
dadurch gekennzeichnet, 

dass das Bereitstellen eine Zweistufen-PCR umfasst. 
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22. Verfahren nach emem der AnsprOche 1 bis 21, 
dadurch gekennzeichnet, 

dass die fCir das herzustellende Protein kodierende 
Nukleinsauresequenz oder/und die lieterologe Nukleinsauresequenz 
5 zumindest teilweise eine an das jeweiligen Expressionssystem 

angepasste Codon-Nutzung aufweisen. 

23. Verfaliren nacli einem der Anspruche 1 bis 22, 
dadurch gekennzeichnet, 

1° dass die heterologe Nukleinsauresequenz einen fur eine 

Aufreinigungsdomane oder/und einen fiir eine Proteinase- 
Erkennungsdomane kodierenden Abschnitt enthalt. 

24. Reagenz zur Herstellung eines Proteins, umfassend 

^5 (a) eine zu der fur das Protein kodierenden Nukleinsauresequenz 

heterologe Nukleinsauresequenz, die im korrekten Leseraster 
In die Protein-kodierende Nukleinsauresequenz eingefugt 
werden kann, und die in einem Abstand von 6-30 Nukleotlden 
3'-seitig des Translations-Startcodons eine Stem-Loop- 
20 Struktur ausbilden kann, und 

(b) ein zur Herstellung des Proteins geeignetes 
Expressionssystem. 



25 
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Zusammenfassung 

Die Erfindung betrifft ein Verfahren zur optlmierten Herstellung von 
Proteinen in einem in vitro oder in vivo Expressionssystem sowie dafOr 
geeignete Reagenzien. 



PU/ANM/29415P DE-09. 12.2002 
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Figur 1 



C 
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Figur2 



HL mit Stammlange 6bp: -7,8 kcal/mol 

A 
A U 
C U 
U-A 
G-C 
G-C 
U-A 
C-G 
A-U 



5'- AGGAGAUAUACCAUG ACUAGCAAAGGAGAA.. -3' 



HL mit Stammlange 7bp: -8,6 kcal/mol 

CA 
A U 
U C 
U-A 
U-A 
C-G 
G-C 
U-A 
C-G 
A-U 




5 '-....j^GGAGAUAUACCAUG ACUAGCA/VAGGAGAA.. -3' 
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Fignr 2 (Fortsetznng) 



HL mit Stammlange 4bp: -4,1 kcal/mol 

UU 
A U 
A-U 
U-A 
C-G 
A-U 

5 AGGAGAUAUACCAUG ACUAGCAAAGGAGAA... -3' 



HL mit Stammlange 5bp: -4.4 kcal/mol 

UA 

u u 

U-A 
G-C 
U-A 
C-G 
A-U 



5'- AGGAGAUAUACCAUG ACUAGCAAAGGAGAA... -3' 



HL mit Stammlange 8bp: -"^^.^ kcal/mol 

U U 
G-C 
C-G 
A-U 
C-G 
G-C 
U-A 
C-G 
A-U 



5*- AGGAGAUAUACCAUG ACUAGCAAAGGAGAA... -3' 
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Figar4 

HL mit Stamml3nge 8bp. 6 Basen nach Start-ATG: 

GA 
U U 
G-C 
C-G 
A-U 
C-G 
G-C 
U-A 
C-G 
A-U 



5 -....AGGAGAUAUACCAUGACUAGC AAAGGAGA/^... -3' 



HL mit Stammlange 8bp. 9 Basen nach Start-ATG: 



GA 
U U 

G-C 

C-G 

A-U 

C-G 

G-C 

U-A 

C-G 
A-U 



5 - AGGAGAUAUACCAUGACUAGCA^ GGAGAA... -3' 

HL mit Stammlange 8bp, 12 Basen nacii Starl-ftTg': 

■ Vc^ 

C-G 
• A-U 
C-G 
G-C 
U-A 
C-G 
A-U 
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Fignr 4 (Fortsetzong) 



5'- 



.....AGGAGAUAUACCAUGACUAGCAAAGGA 



GAA... -3' 



OA 
U U 
G-C 
C-G 
A-U 
C-G 
G-C 
U-A 
C-G 
A-U 



5'-..,. j\GGAGAUAUACCAUGACUAGCAA A GGAGAA.,. -3' 



HL mit StammI3nge 8bp, 12 Basen nach Statt- /^T^ : 

G-C 
C-G 
A-U 
C-G 
G-C 
U-A 
C-G 
A-U 



6 -....^GGAGAUAUACCAUGACUAGCAAAGGA GAA... -3' 
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Fignr 4 (Foitsetznng) 

- HL mit Stammlange 8bp, 1 5 Basen nach Start-ATG: 

GA 
U U 
G-C 
C-G 
A-U 
C-G 
G-C 
U-A 
C-G 
A-U 



6'. AGGAGAUAUACCAUGACUAGCAAAGGAGAA GAA.. -3' 



. HL mit Stammlange 8bp, 1 8 Basen nach Start-ATG: q ^ 

U U 
G-C 
C-G 
A-U 
C-G 
G-C 
U-A 
C-G 
A-U 



5'-....AGGAGAUAUACCAUGACUAGCAAAGGAGAAGAA CTT... -3' 



HL mit Stammlange 8bp, 21 Basen nach Start-ATG: ^ ^ 

U U 
G-C 
C-G 
A-U 
C-G 
G-C 
U-A 
C-G 
A-U 



6'- AGGAGAUAUACCAUGACUAGCA/\AGGAGAAGAACTT TTC... -3' 




Absfand des Loops vom Start ATG 
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Figiir6 



Spur 1-9= Mutante 9-1 Spur 1 entspricbt der Wildlypsequenz 




1 234 5 6789 10 
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Figur? 



GFP/1049 

Spur 1^2= Mutante 1»2 GFP ohne Loop. Spur 3,4= Mutante 1,2 GFP mit Loop. 
Spur 5 entspricht GFP "V^dtypsequenz. Spur 6,7= Mutante 1,2 1049 
ohne Loop. Spur 8,9= Mutante 1,2 1049 mit Loop. Spur 10 entspricht der 
1049 Wildtypsequenz. 



123456789 10 
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FigurS 



Surviviii 

Spur 1-9= Mutante 1-9 Spm 10 eDtspricbt der Wndtypseqamz 



V 1 2 3 4 5 6 7 8 9 10 
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Figur9 



GFP 

Spur 1-9= Miitante 1-9 Spur 10 entspricfat der ynidtypseqaeaz 




123456789 10 
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FigurlO 



GFP/1049 

Spur 1,2= Mutante 1,2 GFP ohne Loop. Spur 3,4= Mutante 1,2 GFP mit Loop. 
Spur 5 entspricht d&r GFP Wndtypsequenz. Spur 6,7= Mutante 1,2 1049 
ohne Loop. Spur 8,9= Mutante 1,2 1049 mit Loop. Spur 10 entspricht der 
1049 Wildtypsequenz. 



123 45 67 89 10 




# 
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Figurll 




CnXA/Survivin 

Spur 1 entspricht der CIITA Wildtypsequenz.Spnr 2,3= Mutante 1,2 CIITA mit 
Loop. Spur 4,5= Mutante 1,2 CIITA ohne Loop. Spur 6 entspricht der 
Survivin Wildtypsequenz. Spur 7,8= Mutante 1,2 SurviTui mit Loop. Spur 
9,10= Mutante 1,2 Survivin ohne Loop.. 



12345 6789 10 
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Figur 12 



Loop 
GA 
T T 
G-C 
C-G 
A-T 
C-G 
G-C 
T-A 
C-G 



Loop' 
GA 
A T 
T-A 
A-T 
A-T 
A-T 
C-G 
A-T 
G-C 
A-T 

C-G-T-A 
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FignrlS 



1049/Survivin/CnTA Loop und Loop'-Variantoi 

Spur 1 1049 Mutante 1 Loop, Spur 2 Mutante 1 Loop', Spur 3 enfspricht der 
1049 Wildtypsequenz; Spur 4 Survivin Mutante 1 Loop, Spur 5 Mutante 1 
Loop ', Spur 6 entspricht der Survivin Wildtypsequenz; Spur 7 CIITA 
Mutante 1 Loop, Spur 8 Mutante 1 Loop', Spur 9 entspricht der CUTA 
Wildtypsequenz 




1 2 3 4 5 6 7 8 




